时间序列数据是在特定时间内监测或记录下的有序数据集合.太阳活动、潮汐、股票市场趋势、疾病传播等都是时间序列的典型案例。是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的前提是认为这些收集到的数据点在一段时间内的变化可能具有特定的内部结构,比如趋势季节变化等等。在此前提下,通过比较不同时间点上单个或多个时间序列的值,对时间序列数据进行分析,进而提取出数据特征。
一般时间序列(如下图)可以被分解成的三个部分:趋势性、季节性和随机性。实际观测到的通常是最上面曲线的形态,它由下面三个曲线叠加而成的结果——趋势性(第二条曲线),季节性(第三条曲线)和随机性(第四条曲线)。
时间序列分析的目的主要有两个,一是要识别监测到的数据所展现出的现象及其本质,就是找到规律,这个规律往往是趋势性的或者有着较为明确的周期即季节性,因此就需要去掉一些不必要的噪音干扰(比如上面的的第四条曲线),并且把趋势性和季节性分解出来,想图示那样;二是要利用这些数据来预测未来同样时间轴上可能会出现的数值(统筹考虑三个分解部分)。时间序列预测法可分为:简单序时平均数法、加权序时平均数法、移动平均法、加权移动平均法、趋势预测法、指数平滑法、季节性趋势预测法、市场寿命周期预测法等这两个目的都要求我们识别时间序列数据内在的模式并将其尽可能准确地描述出来。因为事物发展的规律在长期内相对稳定(比如你女票的大姨妈来访这样的事件的发生),所以趋势性和季节性这样代表规律的因素,它们的数值变化也相对稳定,在未来的一定时期内,还会像现在看到的这样子变化,所以一旦我们了解了数据系列的模式,就可以解释这些数据并结合其他数据来做预测(例如:季节性商品价格的变化和预测)。通常,时间序列数据中都会含有随机扰动因素的影响,这些具有不确定性的因素导致的数量变化被统称为随机变量,业内常见的是通过“平滑数据”的方法来降低或消除随机变量带来的影响。平滑法案例学习在对时间序列进行分析的时候,首先需要考虑其是否是白噪声序列,如果是白噪声序列则不必对其进行分析,因为其不存在稳定性,分析是没有价值的,同时验证数据是否平稳,如果一组非平稳时间序列之间不存在协整关系,则这一组变量构造的回归模型就有可能出现伪回归。残差序列是一个非平稳序列的回归被称为伪回归,这样一种回归有可能拟合优度、显著性水平等指标都很好,但是由于残差序列是一个非平稳序列,说明了这种回归关系不能够真实的反映因变量和解释变量之间存在的均衡关系,而仅仅是一种数字上的巧合而已。伪回归的出现说明模型的设定出现了问题,有可能需要增加解释变量或者减少解释变量,抑或是把原方程进行差分,以使残差序列达到平稳。 1、单位根检验是序列的平稳性检验,如果不检验序列的平稳性直接OLS容易导致伪回归。2、当检验的数据是平稳的(即不存在单位根),要想进一步考察变量的因果联系,可以采用格兰杰因果检验,但要做格兰杰检验的前提是数据必须是平稳的,否则不能做。3、当检验的数据是非平稳(即存在单位根),并且各个序列是同阶单整(协整检验的前提),想进一步确定变量之间是否存在协整关系,可以进行协整检验,协整检验主要有EG两步法和JJ检验A、EG两步法是基于回归残差的检验,可以通过建立OLS模型检验其残差平稳性B、JJ检验是基于回归系数的检验,前提是建立VAR模型(即模型符合ADL模式)
4、当变量之间存在协整关系时,可以建立ECM进一步考察短期关系,Eviews这里还提供了一个Wald-Granger检验,但此时的格兰杰已经不是因果关系检验,而是变量外生性检验,请注意识别。
5、格兰杰检验只能用于平稳序列。这是格兰杰检验的前提,而其因果关系并非我们通常理解的因与果的关系,而是说x的前期变化能有效地解释y的变化,所以称其为“格兰杰原因”。6、非平稳序列很可能出现伪回归,协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归,即检验变量之间是否存在稳定的关系。所以,非平稳序列的因果关系检验就是协整检验。7、平稳性检验有3个作用:1)检验平稳性,若平稳,做格兰杰检验,非平稳,作协正检验。2)协整检验中要用到每个序列的单整阶数。3)判断时间学列的数据生成过程。8、协整结果仅表示变量间存在长期均衡关系。结合7考虑,只有变量不平稳才需要协整检验。所以,首先因对变量进行差分,平稳后,可以用差分项进行格兰杰因果检验,来判定变量变化的先后时序,之后,进行协整,看变量是否存在长期均衡。长期均衡并不意味着分析的结束,还应考虑短期波动,要做误差修正检验。
9、单位根检验是检验数据的平稳性,或是说单整阶数。10、协整是说两个或多个变量之间具有长期的稳定关系。但变量间协整的必要条件是它们之间是同阶单整,也就是说在进行协整检验之前必须进行单位跟检验。协整说的是变量之间存在长期的稳定关系,这只是从数量上得到的结论,但不能确定谁是因,谁是果。而因果关系检验解决的就是这个问题。
11.VAR建模时lag intervals for endogenous要填滞后期,但是此时你并不能判断哪个滞后时最优的,因此要试,选择不同的滞后期,至AIC或SC最小时,所对应着的滞后为最优滞后,此时做出来的VAR模型才较为可靠。12.做协整检验前作VAR的原因是,协整检验是对滞后期和检验形式非常敏感的检验,首先需要确定最优滞后。由于VAR是无约束的,而协整是有约束的,因此协整检验的最优滞后一般为VAR的最优滞后减去1,确定了最优滞后后,再去诊断检验形式,最终才能做协整。13.当确定了协整的个数后,往下看,有个标准化的结果,这个结果就是协整方程,由于在结果中各变量均在方程一侧,因此如果系数为正,则说明是负向关系,反之亦然。14.协整表示变量间的长期均衡关系,貌似与你的OLS不矛盾。(1)如检验不协整,说明没长期稳定关第,可以做VAR模型,但是模型建立后要做
稳定性分析:做AR根的图表分析,如所有单位根小于1,说明VAR模型定,满足脉冲分析及方差分解所需条件之一模型的因果关系检验 2 不过注意在做因果检验前要先确定滞后长度,方法见高铁梅 计量分析方法与建模 第2版 P302 只有满足因果关系,加上满足条件一:稳定性,则可进行脉冲及方差分解如不满足因果关系,则所有不满足因果关系的变量将视为外生变量 ,至此要重新构建VAR模型,新的VAR模型将要引入外生变量的VAR模型(2)VAR与VEC关系是:VEC是有协整约束(即有长期稳定关系)的VAR模型,多用于具有协整关系的非平稳时间序列建模 高铁梅 计理分析方法与建模 第2版 P295
第一步:不问序列如何均可建立初步的VAR模型(建立过程中数据可能前平稳序列,也可能是部分平稳,还可能是没协整关系的同阶不平稳序列,也可能是不同阶的不平稳序列,滞后阶数任意指定。所有序列一般视为内生向量)2 在滞后阶数确定后进行因果关系检验,以确定哪些序列为外生变量至此重新构建VAR模型(此时滞后阶数已定,内外生变量已定),再进行AR根图表分析,如单位根均小于1,VAR构建完成可进行脉冲及方差分解如单位根有大于1的,考虑对原始序进行降阶处理(一阶单整序列处理方法:差分或取对数,二阶单整序列:理论上可以差分与取对数同时进行,但由于序列失去了经济含义,应放弃此处理,可考虑序列的趋势分解,如分解后仍然不能满足要求,可以罢工,不建立任何模型,休息或是打砸了电脑),处理过后对新的序列(包括最初的哪些平稳序列)不断重复第一步与第二步,直至满足稳定性为止如果变量不仅存在滞后影响,还存在同期影响关系,则建立VAR模型不太合适,这种情况下需要进行结构分析。